AI资讯新闻榜单内容搜索-Reasoning

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Reasoning
田渊栋与Russell团队联手,证明Transformer能在训练中自然学会叠加推理

田渊栋与Russell团队联手,证明Transformer能在训练中自然学会叠加推理

田渊栋与Russell团队联手,证明Transformer能在训练中自然学会叠加推理

该团队 2025 年的研究《Reasoning by superposition: A theoretical perspective on chain of continuous thought》已从理论上指出,连续思维链的一个关键优势在于它能使模型在叠加(superposition)状态下进行推理:当模型面对多个可能的推理路径而无法确定哪一个是正确时,它可以在连续空间中并行地保留所有可能的路

来自主题: AI技术研报
8541 点击    2025-10-08 11:41
让机器人「不只是走路」,Nav-R1引领带推理的导航新时代

让机器人「不只是走路」,Nav-R1引领带推理的导航新时代

让机器人「不只是走路」,Nav-R1引领带推理的导航新时代

这篇题为《Nav-R1: Reasoning and Navigation in Embodied Scenes》的新论文,提出了一个新的「身体体现式(embodied)基础模型」(foundation model),旨在让机器人或智能体在 3D 环境中能够更好地结合「感知 + 推理 + 行动」。简单说,它不仅「看到 + 听到+开动马达」,还加入清晰的中间「思考」环节。

来自主题: AI技术研报
5793 点击    2025-09-18 14:28
击败Meta登榜首:推理增强的文档排序模型ReasonRank来了

击败Meta登榜首:推理增强的文档排序模型ReasonRank来了

击败Meta登榜首:推理增强的文档排序模型ReasonRank来了

推理大模型(Large Reasoning Model)极大的促进了自然语言处理领域的发展,而信息检索领域的核心问题之一是文档排序,如何利用强大的推理大模型通过主动推理来判断文档的相关性,进而再对文档进行排序是一个值得探索的方向。

来自主题: AI技术研报
7297 点击    2025-08-21 16:08
400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?

400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?

400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?

还记得分层推理模型(Hierarchical Reasoning Model,HRM)吗? 这项工作于 6 月份发布,当时引起了不小的轰动——X/Twitter 上的相关讨论获得了超过 400 万的浏览量和数万个点赞,剖析这项工作的 YouTube 视频观看量也超过了 47.5 万次。

来自主题: AI技术研报
7796 点击    2025-08-18 12:36
又是王冠:27M小模型超越o3-mini!拒绝马斯克的00后果然不同

又是王冠:27M小模型超越o3-mini!拒绝马斯克的00后果然不同

又是王冠:27M小模型超越o3-mini!拒绝马斯克的00后果然不同

27M小模型超越o3-mini-high和DeepSeek-R1!推理还不靠思维链。 开发者是那位拒绝了马斯克、还要挑战Transformer的00后清华校友,Sapient Intelligence的创始人王冠。

来自主题: AI技术研报
7103 点击    2025-08-10 15:00
GPT-5难产,外媒爆料:性能提升不大,OpenAI高管Slack上当众破防

GPT-5难产,外媒爆料:性能提升不大,OpenAI高管Slack上当众破防

GPT-5难产,外媒爆料:性能提升不大,OpenAI高管Slack上当众破防

赢了的才是「GPT-5」。 GPT-5 迟迟未现身,网友们开始制作各种梗图「吐槽」其实,这几天关于 GPT-5 的传言就没消停。先是有网友在 macOS ChatGPT 应用中发现了 GPT-5-Auto 和 GPT-5-Reasoning 模型的踪迹:

来自主题: AI资讯
6813 点击    2025-08-02 14:28
AI“压力面”,DeepSeek性能暴跌近30% | 清华&上海AI Lab

AI“压力面”,DeepSeek性能暴跌近30% | 清华&上海AI Lab

AI“压力面”,DeepSeek性能暴跌近30% | 清华&上海AI Lab

给AI一场压力测试,结果性能暴跌近30%。 来自上海人工智能实验室、清华大学和中国人民大学的研究团队设计了一个全新的“压力测试”框架——REST (Reasoning Evaluation through Simultaneous Testing)。

来自主题: AI技术研报
9148 点击    2025-07-21 10:44
Sebastian Raschka 新书《从头开始推理》抢先看,揭秘推理模型基础

Sebastian Raschka 新书《从头开始推理》抢先看,揭秘推理模型基础

Sebastian Raschka 新书《从头开始推理》抢先看,揭秘推理模型基础

推理模型发展正盛,著名 AI 技术博主 Sebastian Raschka 也正在写一本关于推理模型工作方式的新书《Reasoning From Scratch》。

来自主题: AI技术研报
7998 点击    2025-05-06 13:58
迈向推理时代:900+篇参考文献揭示长链思维的前世今生,最全综述来了

迈向推理时代:900+篇参考文献揭示长链思维的前世今生,最全综述来了

迈向推理时代:900+篇参考文献揭示长链思维的前世今生,最全综述来了

近年来,大模型(Large Language Models, LLMs)在数学、编程等复杂任务上取得突破,OpenAI-o1、DeepSeek-R1 等推理大模型(Reasoning Large Language Models,RLLMs)表现尤为亮眼。但它们为何如此强大呢?

来自主题: AI技术研报
8940 点击    2025-04-16 15:00
开源深度搜索ODS:释放推理Agent的力量,比GPT-4o Search Preview的准确率提高9.7%

开源深度搜索ODS:释放推理Agent的力量,比GPT-4o Search Preview的准确率提高9.7%

开源深度搜索ODS:释放推理Agent的力量,比GPT-4o Search Preview的准确率提高9.7%

当前搜索AI市场面临着一个显著的断层:Perplexity的Sonar Reasoning Pro和OpenAI的GPT-4o Search Preview等专有解决方案与开源替代品之间存在巨大差距。这些封闭式系统虽然表现优异,但却限制了透明度、创新和创业自由。作为一名正在开发Agent产品的工程师,你是否曾经渴望拥有一个功能强大且完全开放的搜索框架?

来自主题: AI技术研报
8051 点击    2025-04-07 09:06